智能论文笔记

Swiss German Speech to Text system evaluation

Yanick Schraner , Christian Scheller , Michel Plüss , Manfred Vogel

分类：自然语言处理 | 人工智能

2022-07-01

我们对瑞士德语的四个市售语音到文本（STT）系统进行了深入评估。该系统在本报告中被匿名化，并称为系统A-D。我们将这四个系统与我们的STT模型进行了比较，该模型之后称为FHNW，并提供了有关我们如何训练模型的详细信息。为了评估模型，我们使用来自不同域的两个STT数据集。瑞士议会语料库（SPC）测试集和新闻领域中的私人数据集，在七个方言区域进行了均匀分布。我们提供详细的误差分析，以检测三个系统的优势和劣势。该分析受两个测试集的特征的限制。我们的模型在两个数据集上均评分了双语评估研究（BLEU）。在SPC测试集中，我们获得了0.607的BLEU分数，而最佳商业系统的BLEU得分为0.509。在我们的私人测试集中，我们获得了0.722的BLEU分数，最佳商业系统的BLEU得分为0.568。

translated by 谷歌翻译